首页> 外文OA文献 >Parallelizing the QUDA Library for Multi-GPU Calculations in Lattice Quantum Chromodynamics
【2h】

Parallelizing the QUDA Library for Multi-GPU Calculations in Lattice Quantum Chromodynamics

机译:并行化QUDa库在格子中进行多GpU计算   量子色动力学

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Graphics Processing Units (GPUs) are having a transformational effect onnumerical lattice quantum chromodynamics (LQCD) calculations of importance innuclear and particle physics. The QUDA library provides a package of mixedprecision sparse matrix linear solvers for LQCD applications, supporting singleGPUs based on NVIDIA's Compute Unified Device Architecture (CUDA). Thislibrary, interfaced to the QDP++/Chroma framework for LQCD calculations, iscurrently in production use on the "9g" cluster at the Jefferson Laboratory,enabling unprecedented price/performance for a range of problems in LQCD.Nevertheless, memory constraints on current GPU devices limit the problem sizesthat can be tackled. In this contribution we describe the parallelization ofthe QUDA library onto multiple GPUs using MPI, including strategies for theoverlapping of communication and computation. We report on both weak and strongscaling for up to 32 GPUs interconnected by InfiniBand, on which we sustain inexcess of 4 Tflops.
机译:图形处理单元(GPU)正在对重要的核和粒子物理的数值晶格量子色动力学(LQCD)计算产生转换作用。 QUDA库为LQCD应用程序提供了混合精度稀疏矩阵线性求解器的程序包,支持基于NVIDIA Compute Unified Device Architecture(CUDA)的单个GPU。该库已连接到QDP ++ / Chroma框架以进行LQCD计算,目前已在杰斐逊实验室的“ 9g”集群上投入生产使用,为LQCD中的一系列问题提供了空前的价格/性能。但是,当前GPU设备的内存限制可以解决的问题大小。在本文中,我们描述了使用MPI将QUDA库并行化到多个GPU上,包括通信和计算重叠的策略。我们报告了通过InfiniBand互连的多达32个GPU的弱扩展和强扩展,我们维持了不超过4 Tflops。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号